Educacionalmente, informação auditiva é geralmente pensada sob a forma de linguagem falada.
Embora semanticamente similares, as informações encontradas na língua falada vs. língua escrita são processadas de forma diferente.
Informação auditiva também descreve informações não semânticas, tais como alarmes e efeitos sonoros, e as informações altamente especializadas, sob a forma de música.
No caso da música, algumas habilidades, como reconhecer campos relacionados pode ser ensinado, no entanto, outros, como o reconhecimento de ouvido absoluto (que exigem uma memória estável de longo prazo como campo de referência), pode envolver mecanismos cerebrais especializados e requerem aquisição relativamente cedo na vida (Levitin e Rogers, 2005).

Bishop e Cates (2001) forneceu uma estrutura para pensar acerca de som de instrução de uma perspectiva cognitiva (ver Tabela 8.4).
Embora o seu objectivo principal foi investigar o potencial de som de apoio ao software instrucional, a estrutura também é útil para considerar a média do som no isolamento.
Os três tipos de ruídos provenientes do trabalho de Shannon e Weaver, que tem sido interpretado pelo Bishop e Cates (2001) do ponto de vista cognitivo instrucional.
Aquisição de ruído interfere com a recepção de mensagem na instrução.
Ruído de processamento refere-se a problemas com a compreensão da mensagem que foi recebida.
Recuperação de ruído é uma incompatibilidade entre uma mensagem entendida e conhecimento prévio, a experiência, ou atitudes.
Redundância em informação auditiva é importante entender, no contexto da natureza temporal baseado do meio.

Ciclo fonológico de Baddeley (2001) é a memória de curto prazo relacionadas com a informação auditiva. Embora o seu foco era sobre o tratamento da linguagem falada, pode-se considerar a memória de curto prazo de outros tipos de som (como música ou efeitos sonoros) como estando sob as mesmas limitações.
Neisser (1967) se referiu a essa memória como ecóico.
Ao ouvir um som, uma pessoa é capaz de reproduzir uma parte resumidamente nesta memória de curto prazo para processamento adicional.
Isso explica o "efeito cocktail", no qual uma pessoa está envolvida em uma conversa com a exclusão de muitos outros falando no mesmo quarto.

Ordenar prazo memória de áudio permite que a pessoa, num sentido limitado, para controlar e mudar a atenção para uma conversa diferente ao ouvir o seu nome ou alguma outra parte que chama a atenção de informação.
Bishop e Cates (2001) (ver Tabela 8.4) sugeriu o uso de redundância para contornar o carácter temporal da comunicação de áudio.
Conteúdo redundância refere-se à retransmissão ou ampliação das informações de áudio.
Redundância de contexto envolve a apresentação da informação semântica em múltiplas formas para garantir que ela é percebida correctamente.
Finalmente, construir tentativas de redundância para sublinhar a ligação entre a informação e o conhecimento prévio.